2024年的大模型賽事已過(guò)半程。
看過(guò)科技企業(yè)前半程的表現(xiàn),尤其是壓軸上場(chǎng)的華為開(kāi)發(fā)者大會(huì)2024(HDC 2024),越發(fā)確認(rèn)C端大模型和B端大模型的思路真是不一樣。C端大模型在「卷Token長(zhǎng)度」、「卷價(jià)格」,其背後潛在目的是為了「卷數(shù)據(jù)」。他們希望以Token長(zhǎng)度和價(jià)格,捲來(lái)更多的數(shù)據(jù),加速提升大模型的成熟度,進(jìn)而增加生態(tài)黏性。
B端大模型的思路完全不一樣。
HDC 2024期間,華為雲盤(pán)古大模型5.0正式發(fā)布。發(fā)布過(guò)程中,華為雲用了一半時(shí)間講創(chuàng)新技術(shù),另一半時(shí)間講大模型的行業(yè)落地。而且華為雲從下到上所有細(xì)節(jié)都沒一筆帶過(guò),從AI基礎(chǔ)設(shè)施,到多模態(tài)大模型,再到行業(yè)大模型,以及具身智能,每一個(gè)環(huán)節(jié)的想法,華為雲也都交代得清清楚楚。
華為雲發(fā)布盤(pán)古大模型5.0
大模型到底在卷啥?
其實(shí),在「百模大戰」最熱鬧的時(shí)候,也少有人提出「大模型泡沫」的質(zhì)疑。或者說(shuō),在這場(chǎng)關(guān)乎未來(lái)生產(chǎn)力的全球競(jìng)爭(zhēng)中,現(xiàn)在多少卷些也無(wú)所謂。只不過(guò)進(jìn)入2024年,大模型的競(jìng)爭(zhēng)焦點(diǎn)開(kāi)始分化。
「百模大戰」早期,科技企業(yè)是在卷參數(shù)量,千億參數(shù)和萬(wàn)億參數(shù)大模型層出不窮。隨後,部分大模型又開(kāi)始「卷Token長(zhǎng)度」、「卷Token價(jià)格」,但這些都是典型C端大模型的思維。
B端大模型當(dāng)然也缺數(shù)據(jù),尤其是缺高質(zhì)量的中文數(shù)據(jù)。好在,中國(guó)並不缺應(yīng)用場(chǎng)景。兩(liǎng)會(huì)期間提出「人工智慧+」行動(dòng)計(jì)劃(huà),並號(hào)召央企帶頭搶抓人工智慧賦能傳統(tǒng)產(chǎn)業(yè),率先將應(yīng)用場(chǎng)景開(kāi)放出來(lái)。
這就釋放了相當(dāng)積極的信號(hào)。
只不過(guò),挑戰依然存在。企業(yè)中的文本、音頻、圖片、視頻等數(shù)據(jù),散落在不同角落;企業(yè)中的數(shù)據(jù)還要經(jīng)專(zhuān)家級(jí)的標(biāo)註,才能成為高質(zhì)量的訓(xùn)練語料;企業(yè)用戶(hù)對(duì)大模型的識別準(zhǔn)確度,更提出了更高的入職標(biāo)準(zhǔn)。
或者說(shuō):「工作向左,生活向右」。從文理分班的那一刻起,企業(yè)用戶(hù)對(duì)B端大模型的能力結(jié)構(gòu),就提出了不一樣的需求。
不挑食,才能理解物理世界
華為雲在此真下了不少功夫。
去年的這個(gè)時(shí)候,華為雲盤(pán)古大模型3.0發(fā)布,它包括5+N+X三層架構(gòu),是一個(gè)完全面向行業(yè)的大模型系列;今年HDC 2024期間,華為雲盤(pán)古大模型5.0正式發(fā)布,它在多模態(tài)、全系列、強(qiáng)思維等方面進(jìn)行了全新升級(jí)。
其中,「多模態(tài)」能力尤其受到關(guān)注。原因很簡(jiǎn)單,物理世界就是多種模態(tài)的,大模型要走進(jìn)千行萬(wàn)業(yè),大模型要看懂物理世界中的應(yīng)用場(chǎng)景,就需要更多地理解及整合多模態(tài)的行業(yè)數(shù)據(jù)。
此方面的華為雲盤(pán)古大模型5.0,主打的就是一個(gè)不挑食,營(yíng)養(yǎng)均衡。它能夠更好地理解物理世界,更精準(zhǔn)地識別和理解文本、圖片、視頻等數(shù)據(jù),甚至是雷達(dá)、紅外、遙感等更多的模態(tài)數(shù)據(jù)。
上述能力應(yīng)用在圖片和視頻識別方面,盤(pán)古大模型5.0就能夠準(zhǔn)確分析出衛(wèi)星遙感圖像中的農(nóng)作物生長(zhǎng)情況,這可用於產(chǎn)量預估、病蟲(chóng)害監(jiān)測(cè)等領(lǐng)域;它還能夠通過(guò)紅外影像,精準(zhǔn)的識別夜間車(chē)輛的位置,這也將提升交通違停的管理效率。
同時(shí),盤(pán)古大模型5.0的多模態(tài)生成能力,跟Sora關(guān)注點(diǎn)也不一樣。它聚焦於行業(yè)急需的應(yīng)用場(chǎng)景。例如,在自動(dòng)駕駛領(lǐng)域,它就通過(guò)創(chuàng)新的STCG技術(shù),大規(guī)模地生成和實(shí)際場(chǎng)景相一致的駕駛視頻數(shù)據(jù)。甚至,它還可以用模型生成晴天、雨天、黑夜的行車(chē)視頻。
B端大模型的「著陸點(diǎn)」
另一維度,關(guān)注「多模態(tài)」數(shù)據(jù)之外,B端大模型也更關(guān)注「落地點(diǎn)」。2023年,科技企業(yè)都在研究「大材小用」——將大模型落地於小場(chǎng)景。但之後他們發(fā)現(xiàn),「小材小用」或「量才適用」才是更好的思路。
本次HDC 2024,華為雲盤(pán)古大模型5.0就推出了不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務(wù)場(chǎng)景,例如,十億級(jí)參數(shù)的Pangu E系列,可支撐手機(jī)、PC等端側的智能應(yīng)用,屬於典型的「小鋼炮」式大模型。
百億級(jí)參數(shù)的Pangu P系列,則適用於低時(shí)延、高效率的推理場(chǎng)景;千億級(jí)參數(shù)的Pangu U系列適用於處理複雜任務(wù);萬(wàn)億級(jí)參數(shù)的Pangu S系列超級(jí)大模型能夠幫助企業(yè)處理更為複雜的跨領(lǐng)域多任務(wù)。
毫無(wú)疑問(wèn),上述四個(gè)系列的大模型,都是典型B端大模型的思維。它們可落地在智能終端、智慧工廠(chǎng)、企業(yè)大腦、城市IOC等場(chǎng)景,也可以擔(dān)任辦公助理、質(zhì)檢員、網(wǎng)格管理員等職業(yè)角色。
B端大模型的制高點(diǎn)
當(dāng)然,B端大模型的制高點(diǎn)在行業(yè)大模型,制高點(diǎn)上的明珠更是企業(yè)大模型。這也正如華為常務(wù)董事、華為雲CEO張平安所說(shuō):「華為雲盤(pán)古大模型是為解決行業(yè)難題而生。」
過(guò)去的一年,華為雲盤(pán)古大模型已在30多個(gè)行業(yè)、400多個(gè)場(chǎng)景中落地,已在政務(wù)、金融、製造、醫(yī)藥研發(fā)、煤礦、鋼鐵、鐵路、自動(dòng)駕駛、工業(yè)設(shè)計(jì)、建築設(shè)計(jì)、氣象等領(lǐng)域發(fā)揮著巨大價(jià)值。
例如從去年關(guān)注貨運(yùn)的鐵路大模型,到今年推出關(guān)注客運(yùn)的高鐵大模型,就說(shuō)明盤(pán)古大模型的能力又有精進(jìn)。其中搭載了「盤(pán)古眼」的巡檢機(jī)器人,可精準(zhǔn)識別一列動(dòng)車(chē)的3.2萬(wàn)個(gè)項(xiàng)點(diǎn),覆蓋8大類(lèi)、350+種複雜故障,故障識別準(zhǔn)確率可達(dá)99%。
另一需要關(guān)注的是鋼鐵大模型。
寶鋼股份正在推動(dòng)盤(pán)古大模型在熱軋、高爐等場(chǎng)景落地。實(shí)踐表明,在大模型的調(diào)節(jié)下,每減少10℃的溫度波動(dòng),每噸鐵水就可以減少1kg焦炭消耗,成本降低3塊錢。如此一來(lái),預計(jì)每年可以為寶鋼股份降本超過(guò)10億元。
B端大模型知行合一
除此之外,B端大模型的另一思維特點(diǎn)是講究「知行合一」。複雜邏輯推理是大模型成為行業(yè)助手的關(guān)鍵,華為雲則將思維鏈技術(shù)與策略搜索深度結(jié)合,極大提升了數(shù)學(xué)能力、複雜任務(wù)規(guī)劃(huà)能力,以及工具調(diào)用能力。
很明顯,華為雲已經(jīng)在關(guān)注AI應(yīng)用的更高階段。過(guò)去三年,AI應(yīng)用多停留在感知智能、互動(dòng)智能、理解智能階段,典型的應(yīng)用包括人臉識別、智能客服、智能營(yíng)銷(xiāo)、辦公助手、營(yíng)銷(xiāo)助手等。
此次,華為雲升級(jí)大模型的多模態(tài)能力,以及強(qiáng)思維、複雜邏輯推理能力,其實(shí)已經(jīng)是瞄準(zhǔn)了AI Agent智能體和具身智能,這是AI應(yīng)用的更高階段。或可如此比喻,如果大模型是「大腦」,智能體就是「手腳」,具身智能則代表AI應(yīng)用的「知行合一」。
HDC 2024期間,華為雲就展示了諸多具身智能應(yīng)用。盤(pán)古大模型能夠讓機(jī)器人完成10步以上的複雜任務(wù)規(guī)劃(huà),並且在任務(wù)執(zhí)行中實(shí)現(xiàn)多場(chǎng)景泛化和多任務(wù)處理。同時(shí)盤(pán)古大模型還能生成機(jī)器人需要的訓(xùn)練視頻,讓機(jī)器人更快地學(xué)習(xí)各種複雜場(chǎng)景。
更重要的是,華為雲還有殺手鐧。HDC 2024期間,華為正式發(fā)布HarmonyOS NEXT版,「盤(pán)古」和「鴻蒙」也首次聯(lián)袂亮相。而且不同於ChatGPT與蘋果iOS的集成,「盤(pán)古」與「鴻蒙」之間,智能時(shí)代的作業(yè)系統(tǒng)與萬(wàn)物智聯(lián)的作業(yè)系統(tǒng)之間,實(shí)現(xiàn)了深度集成。
這其中典型的應(yīng)用,就包括雲助小藝,以及雲手機(jī)等。而且類(lèi)似的應(yīng)用,已更多地出現(xiàn)在行業(yè)端。據(jù)華為雲合作夥伴介紹:如此的深度集成,系統(tǒng)調(diào)用AI能力將更為流暢,用戶(hù)的數(shù)據(jù)安全也將得到保障,這都是企業(yè)用戶(hù)關(guān)注的核心。
AI全棧能力創(chuàng)新
B端大模型的最後一個(gè)典型思維是,關(guān)注從AI基礎(chǔ)設(shè)施、AI算力,到AI開(kāi)發(fā)平臺(tái)、AI大模型的全棧服務(wù)。
HDC 2024期間,華為雲透露了一組數(shù)據(jù):
業(yè)界萬(wàn)億參數(shù)模型訓(xùn)練無(wú)中斷時(shí)長(zhǎng)是2.8天,華為雲昇騰AI雲服務(wù)可以做到40天無(wú)中斷;業(yè)界集群故障恢復的平均時(shí)間約60分鐘,昇騰AI雲服務(wù)可以縮短到10分鐘。同時(shí),昇騰AI雲服務(wù)還能將大模型的資源開(kāi)通時(shí)間從月級(jí)縮短到天級(jí)。
不僅如此。當(dāng)前雲平臺(tái)在大模型的訓(xùn)練和使用過(guò)程中,一直存在「算力牆」、「內(nèi)存牆」、「能效牆」等問(wèn)題。對(duì)此,華為雲CTO張宇昕說(shuō):「為了解決這個(gè)難題,打造了下一代的雲基礎(chǔ)設(shè)施CloudMatrix,改變了傳統(tǒng)數(shù)據(jù)中心的架構(gòu)和算力供給模式。」
這一基礎(chǔ)設(shè)施,將傳統(tǒng)的以CPU為中心的主從架構(gòu),演進(jìn)為多元算力對(duì)等全互聯(lián)架構(gòu);並通過(guò)高速網(wǎng)際網(wǎng)路協(xié)議,將CPU、NPU、GPU等算力資源全部互聯(lián)和池化,從而把AI算力從單體算力演進(jìn)到矩陣算力,開(kāi)啟智能算力新紀(jì)元。
同時(shí),針對(duì)雲平臺(tái)在大模型的訓(xùn)練和使用中存在的「內(nèi)存牆」問(wèn)題,華為雲首創(chuàng)EMS彈性內(nèi)存存儲(chǔ),基於Memory Pooling專(zhuān)利技術(shù),通過(guò)顯存擴展、算力卸載、以存代算等三大手段來(lái)打破內(nèi)存牆。
解行業(yè)難題、做行業(yè)難事
由此可見(jiàn),華為雲就代表了典型B端大模型的思維。此思維是「不挑食」,努力理解物理世界;是關(guān)注垂類(lèi)模型,尋找更多業(yè)務(wù)「著陸點(diǎn)」;是搶佔行業(yè)大模型的業(yè)務(wù)「制高點(diǎn)」;也是講究「執(zhí)行合一」;更是關(guān)注從AI基礎(chǔ)設(shè)施、AI算力,到AI開(kāi)發(fā)平臺(tái)、AI大模型的全棧技術(shù)創(chuàng)新。
正是在五個(gè)方面持續(xù)投入,華為雲才能年年在開(kāi)發(fā)者大會(huì)上拿出新東西,給開(kāi)發(fā)者、企業(yè)使用;遵循此五個(gè)方面的業(yè)務(wù)路線(xiàn)和技術(shù)路線(xiàn),華為雲也才敢說(shuō):「盤(pán)古將繼續(xù)堅(jiān)定在行業(yè)裡解難題、做難事。」